Loading...

¿Realmente se pueden predecir los retrasos de vuelos?

El retraso o cancelación de un vuelo puede generar un verdadero dolor de cabeza para aquellos pasajeros que tengan una planificación de sus viajes, ya sean estos por vacaciones o por trabajo. Además, el aumento explosivo en los últimos años del tráfico aéreo y la insuficiente infraestructura podría implicar que el número de estos eventos aumente, generando más complicaciones a los usuarios.

Acorde a la Oficina de Estadísticas de Transporte de los Estados Unidos (BTS, por sus siglas en inglés) [1], la duración promedio de los retrasos en los vuelos de las aerolíneas comerciales supera los 50 minutos desde el 2004 y las llegadas tardías son entre el 17 y 20%. Por otro lado se encuentran las pérdidas económicas que generan estos retrasos. Un estudio hecho por la Universidad de California [2], estimó que el costo total producido por retrasos de vuelos en 2007 en los Estados Unidos fue de USD 28.9 mil millones, de los cuales los pasajeros asumieron la mitad. A esto se le suma un costo de oportunidad de USD 3.9 mil millones de los pasajeros que decidieron no viajar para evitar posibles retrasos en sus viajes. A todo esto se le suma las pérdidas económicas a nivel país, donde el estudio calculó que en 2007 el PIB de EE.UU se redujo en USD 4 mil millones.

Como se puede ver, los retrasos y cancelaciones no sólo generan problemas para los pasajeros, sino que también en las aerolíneas y en el país. En consecuencia se genera la necesidad de estudiar cuáles son los factores que producen demora de los vuelos, con tal de reducir el costo en tiempo y dinero a los pasajeros como a las aerolíneas. En este contexto usando datos recopilados y algunas de las estrategias vistas en el curso de Minería de Datos, se espera realizar un análisis de los retrasos de vuelos con el fin de poder generar recomendaciones a los viajeros para que éstos eviten este tipo de inconvenientes.

En este sentido, considerando los diferentes factores que podrían afectar estas demoras, se podrían generar consejos a los pasajeros de los vuelos que menos se retrasan (especificando el momento del día, época del año, aeropuerto y aerolínea menos propensos a retrasos), para así evitar que experimenten largas esperas en los aeropuertos.

Hipótesis y preguntas relativas al tema


En consecuencia de lo ya dicho, surgen varias interrogantes que pretenden ser respondidas con un análisis exploratorio de los datos. A continuación se enumeran algunas de ellas:

  • 1) Las rutas con mayor distancia presentan mayores retrasos en la salida.
  • 2) Los retrasos dependen de factores temporales; es decir, la hora y el día de salida de un vuelo, es determinante en los retrasos. A esto se le suma la época del año y las festividades (Navidad, Año Nuevo, etc).
  • 3) Las rutas más populares (mayor número de vuelos) tiene mayor tasa de retraso.
  • 4) Los retrasos dependen del tamaño de la aerolínea.

Conjunto de datos: Airline On-Time Performance Data


Los datos provienen de la Oficina de Estadísticas de Transporte (BTS, por sus siglas en inglés) del Departamento de Transporte de los Estados Unidos (DOT, por sus siglas en inglés). Consisten en datos de llegada y salida de los vuelos comerciales dentro de EEUU, desde 1987 hasta la actualidad, sin escalas, por mes y año, por compañía y por aeropuerto de origen y destino. Incluye los horarios de salida y llegada programados y reales, los vuelos cancelados y desviados, las causas de demoras y cancelaciones, los horarios de vuelos y las distancias sin escalas [3].
BTS comenzó a recopilar detalles sobre las causas de los retrasos en los vuelos en junio de 2003. Las estadísticas resumidas y los datos sin procesar se ponen a disposición del público en el momento en que se publica el Informe del consumidor de viajes aéreos, que es un resumen mensual del desempeño a tiempo de las aerolíneas y se encuentra disponible en [4].

Según se indica en [3], las aerolíneas informan las causas de los retrasos en cinco categorías amplias:

Los datos se encuentran disponibles de forma mensual (en formato csv) y están conformados por 109 columnas. En este estudio se están utilizando los datos del 2000 al 2017. Este es un gran conjunto de datos, ocupa 5,4 gigabytes de espacio comprimido y 51 gigabytes cuando no está comprimido.

Consideraciones

Un vuelo se considera retrasado si llegó a (o salió) de la puerta de embarque 15 minutos o más después de la hora programada de llegada (o salida) según se refleja en el Sistema de reserva computarizado [1]. Por lo tanto, un vuelo se cuenta como "a tiempo" si operó en menos de 15 minutos después de la hora programada.

Referencias


[1] U.S. Department of Transportation, Bureau of Transportation Statistics, “Transportation Statistics Annual Report 2017”. Washington DC, 2017. [En línea]. Disponible en: https://www.bts.gov/bts-publications/transportation-statistics-annual-reports/tsar-2017 . Accedido: 20-10-2018

[2] Centre for Aviation (CAPA), “Late flights cost US economy USD33 billion”, 2010. [En línea]. Disponible en https://centreforaviation.com/analysis/reports/the-cost-of-delays-late-flights-cost-us-economy-usd33-billion-39215. Accedido: 10-11-2018

[3] U.S. Department of Transportation, Bureau of Transportation Statistics, “Database Name: Airline On-Time Performance Data. Reporting Carrier On-Time Performance (1987-present)”, 2018. [En línea]. Disponible en: https://www.transtats.bts.gov/Tables.asp?DB_ID=120&DB_Name=Airline%20On-Time%20Performance%20Data&DB_Short_Name=On-Time. Accedido: 16-11-2018

[4] U.S. Department of Transportation, of Transportation Statistics, “Air Travel Consumer Reports”, 2018. [En línea]. Disponible en: https://www.transportation.gov/individuals/aviation-consumer-protection/air-travel-consumer-reports. Accedido: 16-11-2018

[5] U.S. Department of Transportation, Bureau of Transportation Statistics, “Understanding the Reporting of Causes of Flight Delays and Cancellations”, 2018. [En línea]. Disponible en: https://www.bts.gov/topics/airlines-and-airports/understanding-reporting-causes-flight-delays-and-cancellations. Accedido: 16-11-2018

[6] U.S. Department of Transportation, Bureau of Transportation Statistics, “Airline On-Time Statistics and Delay Causes, Weather's Share of Delayed Flights National”, 2018. [En línea]. Disponible en: https://www.transtats.bts.gov/OT_Delay/ot_delaycause1.asp?type=3&pn=1. Accedido: 16-11-2018



Otras referencias:
Aviation System Performance Metrics (ASPM) - ASPMWiki, 2017. Types of Delay. Disponible en: http://aspmhelp.faa.gov/index.php?title=Types_of_Delay&action=info Códigos IATA. Disponible en: https://www.iata.org/publications/Pages/code-search.aspx